草庐IT

python - MapReduce编程过滤大输入文件

全部标签

ruby - 执行 ruby​​ 作为 logstash 的管道输入

Logstash允许executingarbitrarycommands作为管道的输入。这是我的示例管道:input{exec{command=>'/usr/bin/ruby-e"putsRUBY_VERSION"'interval=>10}}output{stdout{codec=>rubydebug}}有了这个我得到了以下错误:/opt/logstash/vendor/bundle/jruby/1.9/gems/bundler-1.9.10/lib/bundler/resolver.rb:328:in`blockinverify_gemfile_dependencies_are_f

ruby - 如何编写仅包含特定文件夹和文件夹本身的 Albacore zip 任务?

我正在尝试使用Albacore的ZipTask压缩rake构建的工件.我正在构建的解决方案包含三个项目,这些项目的工件需要单独压缩,但这里只提及ASP.NETMVC项目。这是解决方案的目录结构:rakefile.rbsolution.slnsrc/(otherprojectsthatarenotrelevant)website/(variousfoldersIdon'twantincludedintheartifacts)bin/Content/Scripts/Views/Default.aspxGlobal.asaxweb.config起初我写了这个任务:website_direct

ruby - 在 Ruby 中解析大文件的最快方法

我有一个大约150MB的简单文本文件。我的代码将读取每一行,如果它与某些正则表达式匹配,它就会写入输出文件。但是现在,遍历文件的所有行(几分钟)只需要很长时间,就像File.open(filename).eachdo|line|#dosomestuffend我知道循环遍历文件行需要一段时间,因为即使我对“#dosomestuff”中的数据不做任何操作,它仍然需要很长时间。我知道一些unix程序几乎可以立即解析这样的大文件(比如grep),所以我想知道为什么ruby​​(MRI1.9)读取文件需要这么长时间,有什么方法可以让它更快吗? 最佳答案

ruby - 组合 RSpec 过滤器?

我一直在查看文档,但似乎缺少对多个过滤器如何工作的描述。有没有人对多个过滤器的行为有很好的解释或很好的解释来源?他们列出的顺序重要吗?这是一个代码示例,其行为可能与预期不同......Rspec.configuredo|c|this_version=get_version_number.to_symc.filter_run:focus=>truec.filter_run_excluding:limit_to=>true,this_version=>falsec.filter_run:new_stuff=>truec.run_all_when_everything_filteredend

ruby - Ruby 守护进程中的错误文件描述符

在MacOSXLion上使用Rubyv1.8.7和Daemonsv1.1.8,我试图编写一个消费者进程并让它作为守护进程运行:#config[:name]=>'idx_my_delete_consumer'#config[:daemon]=>{:multiple=>false,#:backtrace=>true,#:dir_mode=>:normal,#:log_dir=>'/Users/pprakash/consumer.log',#:monitor=>true,#:dir=>'/Users/pprakash/pids'}Daemons.run_proc(config[:name],

ruby-on-rails - 如何在不丢失注释和变量的情况下更新 Rails 语言环境 YAML 文件?

我正在构建一个Ruby脚本来更改config/locales/*.ymlRails语言环境文件的内容。这些文件包含许多有用的注释和变量。通过加载、更新和转储它们,我丢失了这些注释和变量。如何在保留注释和变量的同时以编程方式更新YAML文件? 最佳答案 我不认为你可以。YAML会忽略数据文件中的注释,但不会解析它们,因此它们会在文件加载时被丢弃。加载文件后,它们就消失了。我能想到的做你想做的唯一方法是在YAML之外打开文件,然后编写注释,然后写入使用to_yaml创建的YAML内容。像这样的东西:require'yaml'data={

ruby - Rails 4 引擎是否自动加载引擎的 i18n 语言环境文件?

我有一个关于Rails引擎的问题,在关于Rails引擎的Rails指南中没有提到。我希望在这里得到它。例如,我有一个名为my_engine的引擎和一个名为my_app的应用。出于开发目的,在my_app的Gemfile中,我使用:file键简单地将my_engine包含在以下行中。#my_app/Gemfile...gem"my_engine",:path=>"./../my_engine"...my_engine结构是这样的:.├──Gemfile├──Gemfile.lock├──app│  ├──...||...|├──config│  ├──locales│  │  └──mo

ruby - 在 Ruby 中确定文件的编码

我想出了一种方法来确定我传入的文件的编码(或至少是猜测):defencoding_type(file_path)File.read(file_path).encoding.nameend问题是我有一个15GB的文件,这意味着整个文件都被读入了内存。有没有办法在不需要将整个文件读入内存的情况下完成我在这个方法中所做的事情? 最佳答案 file-mime命令将返回文件的mime类型和编码:file-mimemyfile我的文件:文本/纯文本;charset=iso-8859-1defdetect_charset(file_path)`f

ruby-on-rails - Rails 4 - 设计, guest 用户导致过滤器链停止

我刚刚开始开发Rails4(4.2.3)应用程序,我在其中使用Devise进行用户身份验证。我希望用户能够在注册之前通过创建测试项目并以访客用户身份登录来试用该应用程序。当用户注册(或注册)时,我想将测试项目分配给新的当前用户。我一直在关注Platformatec的指南:https://github.com/plataformatec/devise/wiki/How-To:-Create-a-guest-user创建guest用户有效,但是在注册或进入事件的guest用户session时,我收到以下错误:Filterchainhaltedas:require_no_authentica

ruby-on-rails - 如何使用 rspec 模拟/伪造文件的存在?

这是我的:it"shouldbeabletogetavaliddirectorypath"do@asset.some_file_path.should=="/something/test.jpg"end问题是如果不存在文件,some_file_path返回“/not_here_yet.jpg”。defsome_file_pathifFile.exists(self.my_image_path)returnmy_image_pathelsereturn"/not_here_yet.jpgendend我真的不想在我的测试中创建一个新文件。我有办法伪造该文件的存在吗?我在想一些事情:it"s